ИСПОЛЬЗОВАНИЕ

Наибольшую заинтересованность в развитии новой технологии проявляет, разумеется, Microsoft. Уже к маю компания рассчитывает выпустить дополнение к своей Visual Studio .Net, которое позволит разработчикам без особого труда создавать ресурсы с поддержкой SALT. Примерно в эти же сроки должен появиться и MS Internet Explorer с "родной" поддержкой распознавания речи.

"Речь - наиболее естественный способ общения, - отмечает аналитик Cahner's In-Stat Брайан Стрэчман (Brian Strachman). - Она откроет перед ПК новые рынки". Microsoft планирует выпустить опытную версию комплекта инструментов разработчика (SDK) в качестве дополнения к Visual Studio.Net, предложенному недавно апгрейду своего комплекса инструментов разработки. Новый инструментарий поддерживает спецификацию SALT.

Microsoft представила SDK на малоизвестной выставке голосовых технологий, называемой Avios Speech Expo, которая проходит на этой неделе в Сан-Хосе (штат Калифорния). Выпуск SDK - часть плана разработки инструментов распознавания и синтеза речи, реализацией которого занимается растущее речевое подразделение софтверного гиганта. Председатель правления Microsoft Билл Гейтс давно мечтает наделить ПК средствами голосовой поддержки, что сделает человекомашинный интерфейс более простым по сравнению с современным, основанным на клавиатуре и мыши.

"Главная задача сейчас - дать толчок развитию этого рынка, - сказал руководитель подразделения Microsoft Джеймс Мастен (James Mastan). - Мы надеемся, что данный шаг поможет этому бизнесу встать на ноги".

Параллельно с анонсом первой версии спецификации SALT было представлено несколько продуктов на ее основе: Philips выпустила SALT-браузер, написанный на языке программирования Java и поддерживающий только речевые теги спецификации SALT и первый прототип телефонной SALT-системы; HeyAnita разработала SALT-браузер FreeSpeech; университет Карнеги - Меллона также создал SALT-браузер в рамках открытого проекта OpenSALT.

"SALT Forum доказал, что он способен в самые сжатые сроки выработать спецификацию для поддержки речевых технологий в веб-порталах и обычных приложениях, - сказал представитель SALT Forum Роб Кассел. - Теперь, когда первая версия SALT завершена, разработчики могут создавать информационные системы, доступные любому мобильному пользователю из любой точки мира и в любое время".

Хотя многие компании, специализирующиеся на речевых продуктах, уже заявили о поддержке SALT Forum, их повседневной рабочей речевой платформой остается VoiceXML и они пристально следят за усилиями по ее интеграции с XHTML, составляющими альтернативу проекту Speech Application Language Tags (теги языка речевых приложений), для поддержки многомодальных приложений. Ниже приводятся краткие сведения о некоторых авторитетных игроках рынка речевых технологий, а также молодых фирмах, занимающихся многомодальными приложениями.

Фирма Nuance Communications (Менло-Парк, шт. Калифорния) - разработчик ПО под девизом VoiceWeb - выпускает средства распознавания речи, аутентификации голоса, преобразования текста в речь и голосового взаимодействия с браузерами. Эту технологию часто используют в автоматизированных системах телефонного обслуживания клиентов. Nuance также предлагает инструментарий разработчика для создания речевых приложений. Ее продукт VoiceWeb Server поддерживает VoiceXML 1.0 и "свежую" версию 2.0.

Nuance является сторонником объединения VoiceXML и eXtensible HTML, предложенного в World Wide Web Consortium компаниями IBM, Motorola и Opera Software. При этом SALT она не поддерживает.

Фирма SpeechWorks International (Бостон) - один из учредителей SALT Forum, хотя поддерживает VoiceXML и очень активно участвовала в его разработке.

Компания работает в сфере распознавания естественной речи, верификации личности говорящего и приложений для преобразования текста в речь, выпуская продукты под маркой OpenSpeech. Она тесно сотрудничает с Microsoft и является движущей силой проекта SALT по созданию приложений на речевой платформе Microsoft .Net.

Фирма VoiceGenie Technologies (Торонто, Канада) выпускает продукт VoiceGenie VoiceXML Gateway - Unix-платформу для речевых приложений, включающую интерфейсные карты телефонии и приложения для автоматического распознавания речи и преобразования текста в речь.

VoiceGenie также разрабатывает голосовой браузер и другие приложения, предназначенные для управления контактной информацией, речевого набора телефонных номеров, передачи электронной почты по телефону, управления голосовой почтой, а также календарь с голосовыми напоминаниями. Несмотря на свою поддержку VoiceXML, компания присоединилась и к SALT Forum.

Корпорация Voxeo (Скоттс-Вэли, шт. Калифорния) разрабатывает приложения, воспринимающие естественную речь, для самообслуживания клиентов. Ее платформа Voxeo Voice Center поддерживает распознавание речи, преобразование текста в речь, обработку VoiceXML, интеграцию в среду центров обработки телефонных вызовов и функции управления вызовами. Поддерживая VoiceXML, компания также участвует в SALT Forum.

Фирма Telera (Кэмпбелл, шт. Калифорния) разрабатывает платформу VoiceWeb Application Platform, предназначенную для связи Web и систем телефонии. Она обеспечивает пользовательский доступ к Web-приложениям по телефону. Сюда входят приложения для интерактивного речевого отклика с использованием кнопочного и речевого набора, записи речи, организации очередей, маршрутизации звонков и исходящих извещений.

Все эти приложения создаются и развертываются на основе открытых стандартов, в частности VoiceXML. Telera поддерживает спецификацию VoiceXML 2.0 и является членом группы W3C Voice Browser Working Group, которая ее разработала. Но, как и другие сторонники VoiceXML, компания также участвует в SALT Forum.

Фирмы Kirusa (Беркли-Хайтс, шт. Нью-Джерси) и Lobby7 (Бостон) относятся к числу молодых компаний, специализирующихся на многомодальных приложениях. Kirusa создает инфраструктуру поддержки беспроводных многомодальных приложений для корпораций и операторов связи. Недавно она организовала программу технической и маркетинговой поддержки Kirusa Application Development Program, которая рассчитана на независимых разработчиков, партнеров и пользователей, применяющих ее Multimodal Platform для создания беспроводных многомодальных приложений. Kirusa вступила в SALT Forum, хотя поддерживает и VoiceXML, а недавно объявила о своей кооперации с фирмами Telelogue и VoiceGenie для добавления многомодальных функций в голосовые технологии этих двух компаний.

Lobby7 создает серверы приложений, обрабатывающие многомодальный ввод и вывод при обмене информацией между пользователями и аппаратурой. Эти продукты включают Xmode Network Server для обработки таких взаимодействий между компьютерной аппаратурой и другими устройствами с использованием сетевых подключений и Xmode Embedded Server, который действует на пользовательском устройстве и поддерживает многомодальный интерфейс даже без реального подключения в сеть.

Lobby7 участвует в SALT Forum, однако в своих продуктах также поддерживает VoiceXML и XHTML.

Назад Далее
Hosted by uCoz